Panduan Pemrograman CUDA: Perpindahan ke Komputasi Berbasis Throughput

Komputasi telah mengalami perubahan mendasar dari diasuh untuk latensi rendah desain CPU ke berbasis throughput arsitektur GPU. Sementara CPU seperti sepeda motor pengantar cepat (cepat untuk satu paket), GPU adalah kapal kargo besar: gerakannya lebih lambat per barang, tetapi dapat membawa 50.000 kontainer sekaligus.

1. Latensi vs. Throughput

CPU dirancang untuk meminimalkan "waktu penyelesaian" untuk satu rangkaian instruksi menggunakan prediksi cabang yang canggih. Sebaliknya, Unit Pemroses Grafis (GPU) dirancang untuk memaksimalkan "pekerjaan per detik" dengan mengeksekusi ribuan thread secara paralel, menukar kecepatan thread tunggal demi throughput agregat yang sangat besar.

2. Alokasi Transistor

GPU menyediakan throughput instruksi dan bandwidth memori yang jauh lebih tinggi dibandingkan CPU dalam lingkungan harga dan daya yang serupa. GPU dirancang khusus untuk komputasi paralel yang sangat tinggi dan mengalokasikan lebih banyak transistor ke unit pemrosesan data (ALU), sementara CPU mengalokasikan lebih banyak transistor untuk penyimpanan cache data dan kontrol aliran.

3. Evolusi CUDA

Arsitektur Perangkat Terpadu Komputasi (CUDA) diperkenalkan oleh NVIDIA pada tahun 2006. Ini adalah platform komputasi paralel dan model pemrograman yang memungkinkan peningkatan performa secara dramatis dengan memanfaatkan kekuatan GPU tanpa bergantung pada API grafis.

TERMINALbash — 80x24

> Ready. Click "Run" to execute.

QUESTION 1

Which component consumes the majority of silicon real estate in a traditional CPU?

Arithmetic Logic Units (ALUs)

Control logic and Data Caching

Floating Point Units

Memory Controllers

QUESTION 2

What was the original purpose of the GPU before CUDA?

General purpose scientific computing

Operating system kernel management

Fixed-function hardware for 3D rendering

High-frequency trading

QUESTION 3

In the cargo ship analogy, what represents the 'Throughput'?

The speed at which the ship moves across the ocean.

The total volume of containers delivered at once.

The size of the ship's engine.

The fuel efficiency per container.

QUESTION 4

What is the primary trade-off made by GPUs to achieve high aggregate throughput?

Higher power consumption per unit.

Lower single-thread performance.

Reduced memory bandwidth.

Simplified mathematical precision.

QUESTION 5

Which NVIDIA software component is required to run CUDA applications?

DirectX 12

NVIDIA Driver and CUDA Toolkit

OpenGL Wrapper

Windows GDI+